智能论文笔记

Modeling Historical AIS Data For Vessel Path Prediction: A Comprehensive Treatment

Enmei Tu , Guanghao Zhang , Shangbo Mao , Lily Rachmawati , Guang-Bin Huang

分类：人工智能 | 机器学习

2020-01-02

人工智能的繁荣引起了智能/自主导航的密集利益，其中路径预测是决策支持的关键功能，例如，路线规划，碰撞警告和交通规例。对于海上情报，自动识别系统（AIS）起着重要作用，因为它最近已经为大型国际商业船只制作了强制性，并且能够提供船只的几乎实时信息。因此，基于AIS数据的船舶路径预测是未来海洋智能的有希望的方式。然而，在线收集的现实世界AIS数据只是来自不同类型的船只和地理区域的高度不规则的轨迹段（AIS消息序列），数据质量可能非常低。所以即使有一些作品研究如何使用历史AIS数据建立路径预测模型，但仍然是一个非常具有挑战性的问题。在本文中，我们提出了一个全面的框架来模拟大规模历史AIS轨迹段，以获得精确的血管路径预测。通过现有流行方法进行实验比较验证所提出的方法，结果表明，我们的方法可以通过广泛的边缘来优异地呈现基线方法。

translated by 谷歌翻译

Forecasting User Interests Through Topic Tag Predictions in Online Health Communities

Amogh Subbakrishna Adishesha , Lily Jakielaszek , Fariha Azhar , Peixuan Zhang , Vasant Honavar , Fenglong Ma , Chandra Belani , Prasenjit Mitra , Sharon Xiaolei Huang

分类：机器学习

2022-11-05

The increasing reliance on online communities for healthcare information by patients and caregivers has led to the increase in the spread of misinformation, or subjective, anecdotal and inaccurate or non-specific recommendations, which, if acted on, could cause serious harm to the patients. Hence, there is an urgent need to connect users with accurate and tailored health information in a timely manner to prevent such harm. This paper proposes an innovative approach to suggesting reliable information to participants in online communities as they move through different stages in their disease or treatment. We hypothesize that patients with similar histories of disease progression or course of treatment would have similar information needs at comparable stages. Specifically, we pose the problem of predicting topic tags or keywords that describe the future information needs of users based on their profiles, traces of their online interactions within the community (past posts, replies) and the profiles and traces of online interactions of other users with similar profiles and similar traces of past interaction with the target users. The result is a variant of the collaborative information filtering or recommendation system tailored to the needs of users of online health communities. We report results of our experiments on an expert curated data set which demonstrate the superiority of the proposed approach over the state of the art baselines with respect to accurate and timely prediction of topic tags (and hence information sources of interest).

translated by 谷歌翻译

Discovering novel systemic biomarkers in photos of the external eye

Boris Babenko , Ilana Traynis , Christina Chen , Preeti Singh , Akib Uddin , Jorge Cuadros , Lauren P. Daskivich , April Y. Maa , Ramasamy Kim , Eugene Yu-Chuan Kang

分类：计算机视觉 | 机器学习

2022-07-19

最近显示外部眼睛照片显示出糖尿病性视网膜疾病和HBA1C升高的迹象。在本文中，我们评估外部眼睛照片是否包含有关其他系统性医疗状况的信息。我们开发了一个深度学习系统（DLS），该系统将外部眼睛的照片作为输入，并预测多个全身参数，例如与肝脏有关的参数（白蛋白，AST）；肾脏（EGFR使用无种族的2021 CKD-EPI肌酐方程，尿液ACR）；骨与矿物质（钙）;甲状腺（TSH）;和血数（HGB，WBC，血小板）。开发利用了49,015例糖尿病患者的151,237张图像，在加利福尼亚州洛杉矶县的11个地点接受糖尿病眼镜筛查。评估重点是9个预先指定的全身参数，并利用了3个验证集（a，b，c），涵盖了28,869名患有和没有糖尿病的患者，在加利福尼亚州洛杉矶县和大亚特兰大地区的3个独立地点进行了眼睛筛查。我们将结合了可用临床人口统计学变量的基线模型（例如年龄，性别，种族/种族，糖尿病年）进行了比较。相对于基线，DLS在检测AST> 36，钙<8.6，egfr <60，HGB <11，血小板<150，ACR> = 300和WBC <4时，在检测AST> 36，钙<8.6，Egfr <60，HGB <60，HGB <60，calcium <8.6，Egfr <60，calcium <8.6和wbc <4时，达到了统计学上的显着性能，并且类似于开发集的人口），其中DLS的AUC超过基线的AUC，增长了5.2-19.4％。在验证集B和C方面，与开发集相比，患者人群的差异很大，DLS的表现优于ACR> = 300的基线，而HGB <11升至7.3-13.2％。我们的发现提供了进一步的证据，表明外部眼睛照片包含跨越多器官系统的全身健康生物标志物。需要进一步的工作来研究这些生物标志物是否以及如何转化为临床影响。

translated by 谷歌翻译

Set Norm and Equivariant Skip Connections: Putting the Deep in Deep Sets

Lily H. Zhang , Veronica Tozzo , John M. Higgins , Rajesh Ranganath

分类：机器学习

2022-06-23

置换不变的神经网络是从集合进行预测的有前途的工具。但是，我们表明，现有的置换式体系结构，深度集和固定的变压器可能会在深度时消失或爆炸。此外，层规范（SET变压器中选择的归一化）可能会通过删除对预测有用的信息来损害性能。为了解决这些问题，我们介绍了白皮剩余连接的干净路径原理，并开发了设置规范，这是针对集合量身定制的标准化。有了这些，我们构建了Deep Sets ++和SET Transformer ++，该模型比其在各种任务套件上的原始配对品具有可比性或更好的性能。我们还引入了Flow-RBC，这是一种新的单细胞数据集和置换不变预测的现实应用。我们在此处开放数据和代码：https：//github.com/rajesh-lab/deep_permunt_invariant。

translated by 谷歌翻译

Optimistic Whittle Index Policy: Online Learning for Restless Bandits

Kai Wang , Lily Xu , Aparna Taneja , Milind Tambe

分类：机器学习

2022-05-30

Restless multi-armed bandits (RMABs) extend multi-armed bandits to allow for stateful arms, where the state of each arm evolves restlessly with different transitions depending on whether that arm is pulled. Solving RMABs requires information on transition dynamics, which are often unknown upfront. To plan in RMAB settings with unknown transitions, we propose the first online learning algorithm based on the Whittle index policy, using an upper confidence bound (UCB) approach to learn transition dynamics. Specifically, we estimate confidence bounds of the transition probabilities and formulate a bilinear program to compute optimistic Whittle indices using these estimates. Our algorithm, UCWhittle, achieves sublinear $O(H \sqrt{T \log T})$ frequentist regret to solve RMABs with unknown transitions in $T$ episodes with a constant horizon $H$. Empirically, we demonstrate that UCWhittle leverages the structure of RMABs and the Whittle index policy solution to achieve better performance than existing online learning baselines across three domains, including one constructed via sampling from a real-world maternal and childcare dataset.

translated by 谷歌翻译

Robust and Efficient Medical Imaging with Self-Supervision

Shekoofeh Azizi , Laura Culp , Jan Freyberg , Basil Mustafa , Sebastien Baur , Simon Kornblith , Ting Chen , Patricia MacWilliams , S. Sara Mahdavi , Ellery Wulczyn

分类：计算机视觉 | 人工智能 | 机器学习

2022-05-19

医疗人工智能（AI）的最新进展已提供了可以达到临床专家水平绩效的系统。但是，当在与训练环境不同的临床环境中评估时，这种系统往往会证明次优的“分布式”性能。一种常见的缓解策略是使用特定地点数据为每个临床环境开发单独的系统[1]。但是，这很快变得不切实际，因为医疗数据很耗时，可以注释且昂贵[2]。因此，“数据有效概括”的问题给医学AI开发带来了持续的困难。尽管代表性学习的进展显示出希望，但并未对其好处进行严格的研究，特别是用于分布的设置。为了应对这些挑战，我们提出了RESEDIS，这是一种统一的代表学习策略，以提高医学成像AI的鲁棒性和数据效率。雷雷迪斯使用大规模监督转移学习与自我监督学习的通用组合，几乎不需要特定于任务的自定义。我们研究各种医学成像任务，并使用回顾性数据模拟三个现实的应用程序场景。 RESEDIS表现出明显改善的分布性能，而在强有力的基线上，诊断准确性相对相对提高了11.5％。更重要的是，我们的策略会导致对医学成像AI的强大数据有效的概括，并使用跨任务的1％至33％的重新培训数据匹配强有力的监督基线。这些结果表明，Repedis可以显着加速医学成像AI开发的生命周期，从而为医学成像AI提供了重要的一步，以产生广泛的影响。

translated by 谷歌翻译

Evaluating the Fairness Impact of Differentially Private Synthetic Data

Blake Bullwinkel , Kristen Grabarz , Lily Ke , Scarlett Gong , Chris Tanner , Joshua Allen

分类：机器学习

2022-05-09

差异化私有（DP）合成数据是一种最大化包含敏感信息数据的实用性的有前途的方法。但是，由于抑制了代表性不足的阶级，这些阶级通常需要实现隐私，因此，它可能与公平冲突。我们评估了四个DP合成器，并提出了经验结果，表明这些模型中的三个经常在下游二进制分类任务上降低公平性结果。我们在生成的合成数据中存在公平性与存在的少数群体比例之间建立联系，并发现通过多标签下采样方法预处理的数据训练合成器可以促进更公平的结果而不会降低准确性。

translated by 谷歌翻译

Revisiting Contrastive Learning through the Lens of Neighborhood Component Analysis: an Integrated Framework

Ching-Yun Ko , Jeet Mohapatra , Sijia Liu , Pin-Yu Chen , Luca Daniel , Lily Weng

分类：机器学习 | 计算机视觉

2021-12-08

作为自我监督的代表学习中的一个精美工具，近年来对比学习越来越关注。从本质上讲，对比学习旨在利用用于代表学习的正面和负样本对，这与利用特征空间中的邻居信息涉及利用邻居信息。通过调查对比学习和邻里分量分析（NCA）之间的联系，我们提供了一种对比学习的新型随机最近邻近的观点，并随后提出了一系列优于现有的对比损失。在我们拟议的框架下，我们展示了一种新的方法来设计集成的对比损失，可以同时实现下游任务的良好准确性和鲁棒性。凭借综合框架，我们对标准准确性的高达6 \％改进，提高了对普通准确性的17％。

translated by 谷歌翻译

Next Day Wildfire Spread: A Machine Learning Data Set to Predict Wildfire Spreading from Remote-Sensing Data

Fantine Huot , R. Lily Hu , Nita Goyal , Tharun Sankar , Matthias Ihme , Yi-Fan Chen

分类：计算机视觉

2021-12-04

预测野火蔓延对于土地管理和灾害准备至关重要。为此，我们呈现“第二天野火蔓延，”一种策划，大规模的多变量数据集，历史野火的历史野火占据了美国近十年的遥感数据。与基于地球观测卫星的现有火灾数据集相比，我们的数据集合了2D解释性变量（例如，地形，植被，天气，干旱指数，人口密度）与2D区域对齐，提供了丰富的数据为机器学习设置。为了演示该数据集的有用性，我们实现了一个卷积的AutoEncoder，它利用了该数据的空间信息来预测野火扩散。我们将神经网络与其他机器学习模型的性能进行比较：Logistic回归和随机林。该数据集可以用作基于遥感数据开发野火传播模型的基准，以便有一天的提前期。

translated by 谷歌翻译

Dynamic Placement of Rapidly Deployable Mobile Sensor Robots Using Machine Learning and Expected Value of Information

Alice Agogino , Hae Young Jang , Vivek Rao , Ritik Batra , Felicity Liao , Rohan Sood , Irving Fang , R. Lily Hu , Emerson Shoichet-Bartus , John Matranga

分类：机器人

2021-11-15

虽然工业互联网的东西已经增加了工业设备中永久安装的传感器数量，但由于在石化工业中非常大的植物中的传感器或稀疏密度，覆盖率将存在差距。现代应急响应操作开始使用具有能够将传感器机器人丢弃到精确位置的小型无人机系统（SUAS）。 SUA可以提供长期持续监控，即航空无人机无法提供。尽管这些资产的成本相对较低，但是选择哪个机器人传感系统部署在紧急响应期间复杂的植物环境中的工业过程中的哪一部分仍然具有挑战性。本文介绍了一种优化应急传感器部署作为实现机器人在灾区响应的初步步骤的框架。 AI技术（长期内存，1维卷积神经网络，逻辑回归和随机林）识别传感器最有价值的区域，而无需人类进入潜在的危险区域。在描述的情况下，优化的成本函数考虑了假阳性和假阴性错误的成本。减缓的决定包括实施维修或关闭工厂。信息（EVI）的预期值用于识别要部署的最有价值的类型和物理传感器的位置，以增加传感器网络的决策分析值。该方法应用于使用化学植物的田纳西州伊士曼流程数据集的案例研究，我们讨论了我们对植物紧急情况和弹性情景中传感器的操作，分配和决策的影响的影响。

translated by 谷歌翻译